#Google Gemini
蘋果,低頭了
2026 年 1 月,蘋果與Google確認達成合作,Gemini 將成為 Apple Intelligence 體系的重要技術支撐之一,並用於包括新版個性化 Siri 在內的多項系統級 AI 功能。這並不是一次簡單的 API 接入,而是涉及模型能力、雲端計算以及系統層級整合的深度合作。對外界來說,這個消息的衝擊力,甚至超過了很多具體功能本身:過去三年裡,蘋果在 AI 領域畫過的餅太多,但真正落地的成果太少。WWDC 上展示過的「更懂上下文的 Siri」「能跨應用執行複雜操作的 Siri」更是一次次延期,直到 2026 年,這些能力依然沒有完整交付。圖片來源:Apple而這一次,蘋果沒有繼續強調「完全自研」,而是選擇直接引入 Gemini 作為核心能力來源。更有消息稱,這個全新的 Siri 不久後就會在 iOS 27 的測試版中亮相。考慮到 Siri 和 Apple Intelligence 的畫餅歷史,雷科技對更智能的 Siri 始終持懷疑態度。而這次蘋果與Google的合作,至少說明了一件事——蘋果已經不再堅持「凡事都要自己來」了。Siri 也曾是先進技術的代表不過話又說回來,儘管國內使用者對 Siri 評價非常一般,但作為手機智能助手裡的「老資歷」,Siri 的誕生其實一點都不保守:2011 年,Siri 隨 iPhone 4S 正式發佈,是業內第一批被大規模推向消費級市場的語音助手。要知道在當時,語音互動還停留在指令式輸入的階段,Siri 已經開始嘗試提供語言理解、上下文關聯和服務整合。至少在那個階段,Siri 的出現是具備明顯前瞻性的。但問題在於,作為蘋果的技術產品,Siri 的發展路徑從一開始就被框在了一個保守的技術邊界內。蘋果很早就為 Siri 定下了幾個不容妥協的前提:優先保護隱私、儘可能在端側完成計算、系統行為高度可控。在傳統功能型語音助手時代,這套邏輯是成立的。因為當時的 Siri,本質上只是一個「語音入口」,負責把使用者指令轉譯成系統操作;但當 AI 進入大模型時代,更複雜的 AI 指令帶來了更大的算力缺口,Siri 也開始變得力不從心起來。與 AI 時代脫節不是「一日之寒」在雷科技看來,這種頂層路線的不合時宜,才是 Siri 在 AI 時代體驗「遙遙落後」的根本原因。首先,Siri 的模型規模與能力註定了它不可能好用。在大模型時代,聰明本身就是一種資源密集型能力。更強的理解力、更自然的對話、更複雜的任務拆解,本質上都依賴大規模模型和持續的雲端算力支援。圖片來源:Apple而蘋果在這件事上,一直保持克制:一方面,蘋果希望把 AI 能力儘量壓到端側,減少資料外流;另一方面,蘋果在自建雲端算力上的節奏,也明顯慢於Google、微軟這樣的雲服務原生廠商。這導致 Siri 背後的模型規模長期受限,能力提升緩慢,而使用者對 AI 的期待,卻在 ChatGPT、Gemini 等產品的推動下迅速被拉高。其次,是組織和人才的問題。過去幾年裡,蘋果 AI 團隊的人員流動並不小。從公開資訊來看,不少原本參與核心模型研發的工程師和管理層,陸續被 OpenAI、Google、Meta 等公司吸納。這種流失並不罕見,但在一個高度依賴長期積累的領域,會直接影響研發節奏。更不用說蘋果內部的保密文化對 AI 人才的限制了。在 AI 時代,任何一個技術突破都能在短時間內形成論文、成為研究人員的光鮮履歷和跳槽時的底氣。但在蘋果的保密文化下,除了極少數頭部負責人有在公眾面前露面的機會,大多數研究員都無法將技術與自己掛鉤。在這樣的文化背景下,蘋果 AI 團隊成員接連出走已成必然。而蘋果與 Google、Meta、OpenAI 等巨頭之間的能力差距,也逐漸消耗了外界對 Apple Intelligence 的耐心。能滿足蘋果條件的 AI 模型並不多當然了,蘋果也嘗試過自救,比如講 Apple Intelligence 接入 ChatGPT。但在雷科技看來,對蘋果來說,與Google合作確實是一個更合適當前局面的選擇。首先,OpenAI 的模型能力很大程度上依賴微軟 Azure 的算力。如果蘋果選擇深度繫結 OpenAI,實際上等於在核心 AI 能力上間接受制於微軟,這顯然不符合蘋果一貫強調的獨立性。而Google不僅擁有 Gemini 這樣的自研模型體系,同時也具備成熟的全球雲基礎設施,以及長期服務 Android 與 Pixel 裝置的經驗。在「如何把大模型穩定地嵌入移動系統」這件事上,Google是少數有實戰經驗的公司之一。圖片來源:Google其次,是多模態能力的契合度。Siri 的下一步顯然不是「更會聊天」,而是要理解螢幕、理解應用狀態、理解使用者正在做什麼。這種高度依賴多模態理解的能力,恰好是 Gemini 的強項之一。從這個角度看,Gemini 並不是來「替代 Siri」,而是成為 Siri 背後的理解層和推理層。當然了,既然是雙方合作,那Google的合作態度也非常重要。根據已披露的資訊,Siri 背後的 Gemini 並非直接運行在Google公有雲上,而是被部署在蘋果自建的私有雲端運算體系中。這意味著蘋果依然可以控制資料路徑,維持其隱私敘事。而像 Gemini 這樣同時滿足「模型能力」「雲算力」「隱私控制」這三點的合作方,確實不多。Gemini 能讓蘋果回到 AI 一線嗎?從能力上看,Gemini 的引入,確實有機會補上 Siri 在理解力和執行力上的短板。更複雜的指令拆解、更自然的上下文延續、更穩定的跨應用操作,都是現階段 Siri 明顯欠缺的能力。但這能否把 Siri 重新帶回 AI 助手的第一梯隊,雷科技認為 Gemini 的「藥效」還沒有這麼強。我們知道,AI 能力並不只取決於模型本身,「感知權限」同樣重要。如果蘋果想讓 Siri 重回一線,必然需要在系統層級,真正放權給 Siri。過去 Siri 的很多問題,並不是「不聰明」,而是「不能做」:權限受限、介面不開放、應用不配合,都會直接限制 AI 助手的實際價值。而對國內使用者來說,蘋果與Google的合作也讓 Apple Intelligence 國內落地的情況變得更複雜:Gemini 的引入,必然能為 Siri 帶來質變的提升;但海外模型國內落地的合規性依舊是一道無法繞過的門檻。在這個時間點切換模型,很可能會讓 Apple Intelligence 的入華工作清零。幸運的是,這種不確定性也為國內 AI 廠商創造了機會。圖片來源:豆包如果蘋果證明了一件事——系統級 AI 助手,必須依託頂級模型能力,那麼Android陣營的硬體廠商,也勢必會加快與頭部模型廠商的深度合作。無論是字節、阿里,還是其他大模型團隊,都會迎來新的談判空間。說到底,Siri 和 Gemini 的合作,其實也是蘋果在 AI 時代的一次路線修正。蘋果用直白的技術代差,證明了「有些事情自己真不一定能做」。說到底,iOS 27 能否真正補上那塊畫了三年的 AI 大餅,這個問題沒人說得準。但至少在 2026 年,蘋果終於站到了正確的道路上了。 (雷科技)
自帶 Nano 改圖,一鍵總結 N 個網頁!Chrome 這次更新,讓所有 AI 外掛都下崗了
講真,作為每天和瀏覽器打交道超過 10 小時的“重度衝浪選手”,Chrome 幾乎就是我的第二個辦公桌。自打 AI 爆火之後,為了提效,我這瀏覽器右上角就沒清淨過。我裝了五花八門的外掛:有的專門用來總結長文章,有的用來跟網頁對話……但懂得都懂,沒有一個真的特別好使。直到昨天,Google 親手扔下了一個“核彈級更新”,我瞬間覺得:那些折騰了半天的 AI 外掛,終於可以通通刪掉了!(具體的開啟教學我放在文末了)。圖:Chrome 中整合的 Gemini這次 Chrome 的進化,絕不僅僅是多了一個總結網頁的小工具那麼簡單。它是直接把最強的 Gemini 3 “焊”進了核心裡,讓瀏覽器從一個單純的“閱讀器”,變成了一個真正能替你幹髒活、累活的“數字分身”……01 側邊欄進化:第三方外掛通通可以“下崗”了說實話,AI 側邊欄這東西,大家早就司空見慣了。不管是國外的外掛,還是中國的 Kimi、智譜,早就能讓你一邊看網頁一邊總結、對話。但這次 Chrome 原生的 Gemini 側邊欄,真的讓我想把那些第三方外掛都卸了。因為除了常規操作,它至少有 3 個讓我大喊“臥槽”的狠招:總結網頁只是基本功: 別人能做的它都能做,而且反應速度極快,畢竟是親兒子。圖:Chrome 側邊欄總結網頁你可能不服,這不都能做嗎?Gemini 真正厲害的地方在於,它能同時總結 N 個打開的網頁。以前我想看幾篇文章的摘要,得每個頁面點一次外掛,手都點酸了。現在,它能一次性把所有打開的網頁全讀完,直接甩給我一份彙總好的摘要。(最臥槽的是,你可以讓它用這 N個網頁為素材直接寫篇文章,自媒體人要起飛了!))圖:Chrome 的側邊欄同時總結 N 個網頁再比如我想買個降噪耳機,在京東上開了十幾個產品頁,看得眼花繚亂。現在簡單了,直接讓它幫我全網比價、挑毛病,最後告訴我那款最值得下單。圖:Chrome 側邊欄在 JD 頁面做比價這才是真正的“省心神器”,再也不用在幾十個標籤頁裡反覆橫跳了。視訊“快進鍵”的終結者: 這點最牛。你在看 YouTube 視訊時,它不僅能幫你出總結,最離譜的是它能自動切片。它會把視訊分成好幾個關鍵段落,你看到感興趣的點,點一下文字,進度條直接跳到那個位置。圖:Chrome 側邊欄直接總結視訊並做切片以前看個長視訊得手動拖進度條,現在感覺是 AI 牽著你的手,直接把精華送到你嘴邊。不過有一說一,這功能目前還是有點“偏心”,對 YouTube 的支援簡直是親兒子等級。我也試了下 B 站,雖然也能總結出大概意思,但少了那個最靈魂的“自動切片”,就像吃泡麵沒調料包,效果大打折扣。這些結果可以直接通過 Gmail 發郵件出去,而且這次還把日曆、YouTube、地圖等全部整合進來了。不得不說,Google把自家“全家桶”整合起來的殺傷力真的無敵,這種“自家產品互相開掛”的操作,才是這次更新最頂的地方。02 Nano Banana:這那是瀏覽器,這是隨身帶了個 PS以前在網上看到一張圖想改一改,你得先下載,再開修圖軟體,折騰半天再重新匯出。現在 Chrome 側邊欄直接把 Nano Banana 整合進來了,簡單來說,它就像在瀏覽器裡裝了個“一鍵整容”按鈕。我試了幾個場景,簡直是懶人福音。比如你看到一張色彩鮮豔的素材圖,想看看一張照片變成復古黑白風是什麼效果,不用找濾鏡,在側邊欄說句話就行。圖:Chrome 側邊欄直接修改圖片更神的是,如果你對著一張空蕩蕩的房間照片,想腦補一下裝修後的樣子,直接讓它往裡“塞”滿家具。上一秒還是冷冰冰的毛坯房,下一秒就能變出北歐風的溫馨感。圖:Chrome 側邊欄直接修改圖片甚至當你面對一整個網頁密密麻麻的資料頭大時,直接喊它把網頁內容生成一張精美的資訊圖,這對於每天做 PPT 的人來說,簡直是救了命了。圖:Chrome 側邊欄生成資訊圖這種“即看即改”的操作,以前得折騰好幾個 App,現在動動嘴皮子就在瀏覽器裡順手辦了。03 終極殺招:它不是在聊天,是在替你“上班”如果說前面的功能只是讓你“看得爽”,那接下來的 Auto browse(自動瀏覽) 簡直是讓 Chrome 長出了手腳。我試了幾個官方案例,確實有點科幻。比如最枯燥的自動填表,你只需把資料甩給它,它能自動識別並把另一個表單填得整整齊齊。更神的是,比如你想辦個主題派對,看到一張氛圍感拉滿的佈置圖,不用你肉眼去搜同款。它能直接識別圖裡的復古電視、氣球、裝飾品,去電商網站搜出同款並一鍵塞進購物車,連券都領好了,你只管付錢。甚至連訂酒店、查航班這種瑣事,它都能根據你的要求直接出一套最優方案。不過,我也得說句大實話: 這一招目前對國外網站確實很猛,但我實測發現,它還沒學會怎麼逛京東、淘寶或攜程,基本處於“罷工”狀態。(所以這裡用了官方的案例)雖然這種“數字替身”的未來很爽,但中國使用者不知道啥時候能享受到。04 隱藏教學:怎麼強先開啟這個“黑科技”?看到這兒,估計大家手裡的外掛已經按捺不住要刪了。不過目前這些功能還在灰度測試中,如果你想現在就體驗,可以試試這套“極客開啟方案”:第一步:開啟隱藏開關(Flags)先升級 Chrome 到最新版,然後在網址列輸入 chrome://flags/  進入實驗室。在搜尋框輸入 “glic”,把搜出來的這五項全部從 Default 改成 Enabled:GlicGlic Z Order ChangesGlic actorGlic Pre-WarmingGlic FRE Pre-Warming圖:開啟 Chrome 的相關選項點選右下角的 “Relaunch”(重新啟動)即可。第二步:如果還沒出來,試試這幾條“黑指令”如果你重啟了還沒看到 Gemini 出現,那說明被地域限制鎖死了。這時候需要先徹底退出 Chrome,然後打開終端(Terminal)執行下面這幾行命令,直接給它來個“強制開啟”:💡 小提示: 執行前建議先備份。命令中的 ~/Library/Application Support/Google/Chrome/ 路徑適用於 Mac 使用者。另外,你的 Chrome 需要設定為英文,而且 IP 地址必須設定為美國。這一頓操作之後再次打開 Chrome,你就能看到那個能替你“上班”的數字分身了。寫在最後不得不感嘆,2026 年開年這一個月,AI 圈的節奏快得讓人窒息。特別是這兩天全網刷屏、幾乎把智能體推向神壇的 ClawdBot(Moltbolt),大家應該都看出來了:“智能體(Agent)”化已經是大勢所趨。以往是我們“用”瀏覽器去找資訊,現在是 AI 正在“接管”瀏覽器去辦實事。而這次 Gemini 與 Chrome 的深度融合,意義完全不同。畢竟 Chrome 是全球幾十億人的裝機必備,它這次的“超進化”,意味著 AI 這種處理資訊的方式,正在從極客的小眾玩具,徹底變成普通人觸手可及的日常工具。雖然現在對中國 App 的適配還沒那麼絲滑,但這種“有人幫我幹活”的未來,確實已經近在咫尺了。最後互動一下:如果 AI 真的能替你處理掉所有無聊的填表、訂票、比價工作,你最想用省下來的時間幹點啥? (AI范兒)
GoogleChrome史詩級更新!Gemini 3原生植入,瀏覽器終於能“自己動”了?
Chrome 瀏覽器剛剛迎來了一波史詩級加強!Google官方剛剛宣佈,將最強的 Gemini 3 模型直接塞進了 Chrome 裡。注意,這次不是在側邊欄加個簡單的對話方塊,而是引入了真正的 Agentic AI 能力。簡單來說:以前你的瀏覽器是用來“看”網頁的,現在的瀏覽器,真的能自己“上網”幹活了。01 真正的“自動駕駛”:Auto Browse這是本次更新的重頭戲——Auto Browse(自動瀏覽)。基於 Gemini 3 的多模態能力,Chrome 現在可以處理複雜的多步驟工作流(Multi-step workflows)。它不再只是給你吐出文字建議,而是像一個真實的私人助理一樣,幫你點選連結、尋找資訊、填寫表單,甚至處理那些極其繁瑣的“髒活累活”。舉個簡單的例子:假設你要舉辦一場 Y2K 復古主題派對,但不知道買什麼裝飾品。以前你需要:去小紅書/Pinterest找靈感 → 截圖 → 去淘寶/亞馬遜搜同款 → 比價 → 加購物車。現在,你只需要給 Auto Browse 一張參考圖:“Gemini,幫我看看這張圖裡都有什麼,然後幫我搜同款,要便宜的,直接加進購物車。”Gemini in Chrome能夠理解你的創意構想,幫你尋找非常具體的派對裝飾品並將其加入到購物中Gemini 3 會利用其視覺能力識別圖片中的物品,自動在電商網站搜尋相似款,利用優惠碼確保不超預算,甚至最後一步直接幫你把東西放進購物車。如果不只是買東西呢?根據Google的內測,測試者們已經開始用它來幹這些事了:全網比價:自動查詢不同日期的酒店和機票價格,不僅是看,而是幫你規劃。可以幫你找到合適的公寓,並根據你的條件篩選結果可以根據對酒店和航班的要求,為你推薦最佳的周末住宿方案。填表狂魔:自動填寫繁瑣的線上表格,甚至幫忙報稅。可以根據PDF檔案中的資訊自動填寫表單生活瑣事:給水管工查報價、管理訂閱服務、甚至更新駕照。一句話總結:那些你不想幹的重複性勞動,現在瀏覽器全包了。當然,我知道大家擔心什麼——安全。Google也強調了“Security by design”。對於敏感操作(比如付款、在社交媒體發帖),Auto Browse 會自動暫停,必須經過你的明確確認才會執行。它能幫你省心,但不會自作主張亂花你的錢。自動瀏覽功能能讓你隨時瞭解最新情況,並要求你確認敏感操作02 側邊欄進化:不切屏,才是真效率為了配合強大的 AI 能力,Chrome 這次還推出了全新的側邊欄體驗(Side Panel Experience)。不知道大家有沒有這種痛苦:寫論文/寫程式碼的時候,為了查一個資料,切出去開了個新標籤頁,然後不知不覺就開始刷別的東西,半小時回不來。現在的 Gemini 側邊欄,主打一個“伴隨式服務”:你可以在主窗口保留你的核心工作(比如正在寫的文件),然後在側邊欄喚起 Gemini 處理雜事。比如:多方比價:不用開10個電商頁面來回切,直接在側邊欄讓它把不同網站的產品優缺點列出來。總結評論:打開亞馬遜商品頁,側邊欄直接告訴你“這東西大家覺得那裡不好”。日程管理:在混亂的日曆裡幫你找空閒時間,而你不需要離開當前的網頁。瀏覽器中的 Gemini 會在側邊欄打開,方便進行多工處理一句話總結:它就像坐在你旁邊的實習生,你只管主線任務,支線任務丟給它,不用切屏,不用打斷心流。03 Nano Banana:網頁圖片,原地“整容”他們很久之前發佈了一個名字很怪、但功能很暴力的模型:Nano Banana。這是一個直接整合在 Chrome 裡的圖像生成/修改能力。它的核心賣點是 “On the fly”(即時修改)。以前我們在網頁上看到一張圖,想改一下,得先“右鍵另存為”→“打開PS/美圖秀秀”→“修改”→“上傳”。現在?根本不需要下載。你只需要在側邊欄輸入一句 Prompt(提示詞),告訴它你想怎麼改,網頁上的那張圖就會原地變形。無需複製貼上或重新上傳;使用 Nano Banana 在當前瀏覽器窗口中轉換圖像比如這張客廳的照片,你可以直接讓 Gemini 給它換個“現代風”裝修,或者把一份枯燥的資料圖表直接轉化成一張精美的資訊圖。這就很適合做設計、做PPT的朋友,找素材的時候,沒有合適的?直接讓瀏覽器給你“捏”一張出來。04 打通全家桶 & 什麼時候能用?最後,作為Google親兒子,Chrome 這次徹底打通了 Connected Apps(關聯應用)。Gemini 可以直接呼叫你的 Gmail、日曆、地圖、YouTube 甚至 Google Flights 的資料。舉個場景:你要去開會,但是忘記航班資訊了。 Gemini 可以幫你從幾個月前的舊郵件裡把航班資訊挖出來,結合地圖給你推薦行程,最後幫你草擬一封郵件告訴同事你幾點到。可以與其他 Google 應用(例如 Gmail)配合使用📍 如何體驗?根據官方消息,這些更新正在向 MacOS, Windows 和 Chromebook Plus,AI Pro/Ultra 使用者陸續推送。如果你手裡的 Chrome 還沒收到更新,不妨去檢查一下版本,或者再耐心等等。 (奇點前哨)
Google 王炸更新 Gemini 和 Chrome 合體 絞殺一切競爭對手...
很多人一直吐槽 Google,Gemini 那麼強了,人家都推出了AI瀏覽器,為什麼Chrome 卻一直還是原地踏步?Google 到底在幹嘛?現在它終於來了Gemini 和 Chrome 合體了...Google 剛剛發佈了基於最新 Gemini 3 模型的 Chrome 重大更新,這不僅僅是一個外掛或側邊欄的升級,而是對瀏覽器核心邏輯的重構。Chrome 正在從一個被動的“網頁瀏覽工具”,進化為一個能夠主動思考、替你幹活的“智能代理(Agentic AI)”。說實話,以前咱們用 AI 得經歷多少步驟?先開網頁、登帳號、想 Prompt,萬一網速不給力還得轉半天圈圈。要是想讓 AI 總結個網頁,還得在那兒苦哈哈地複製貼上,簡直麻煩得要死。這次升級後,Chrome 基本上變成了 Gemini 的“完全體容器”。Google 這次是打算把 AI 直接縫進你的瀏覽肌肉裡,甚至要開啟“無人駕駛”模式。這就帶大家看看,Google 這次到底在構思什麼“大殺器”。👇先文字長的,看視訊介紹:Side Panel:從“彈窗”變成“常駐協作者”Google 給 Chrome 加了一個新的 側邊欄(Side Panel)。Side Panel不只是一個簡單的聊天框,它變成了一個全能的指揮中心。以前用 AI,你得切出去,複製貼上,再切回來。現在?它就住在你手邊無論你打開那個標籤頁,Gemini 都隨時可用而且最重要的是:它能看懂你在看什麼多工處理神器:你可以一邊在首頁面寫方案、看資料,一邊讓側邊欄裡的 Gemini 去對比多個網站的產品資訊、彙總評價、提煉結論。比如你正在瀏覽幾個不同的數位產品頁面,你可以讓側邊欄裡的 Gemini 直接生成一個“橫向對比表”,把這幾個網頁的參數全部抓取並整理出你可以在首頁面繼續當前工作同時在側邊欄讓 Gemini 處理另一項任務不打斷、不切換、不複製貼上內建Nano Banana:螢幕上的圖片,直接改這是 Google 在端側 AI 上的新突破。你可以在瀏覽器裡直接對網頁上的圖片進行處理。以前你想看看一件家具放在房間裡是什麼效果,得先下載圖片、上傳到編輯器、祈禱效果還行……現在不用了。你可以直接指著螢幕上的圖片,讓 Gemini 修改...比如你看到一個房間的照片,想看看它更換裝修風格的樣子,你可以說:"幫我把這個房間換成淺色現代風家具。"它就直接生成了。不需要下載,不需要上傳,所見即所改。Google Workspace 深度打通Gemini 和 Google 全家桶的聯動也更深了。演示裡有個場景:你在看一份課程大綱(比如某個讀書會的書單),需要給學習小組發一封郵件,介紹一下要讀的書。以前怎麼做?1.看大綱,記住書名2.切到 Gmail,新建郵件3.切回大綱,複製書名4.切到 Gmail,貼上5.想寫介紹?再去搜一下這本書講什麼6.來回切換到頭暈……現在呢?你讓 Gemini 讀當前頁面的大綱,然後說:"從裡面挑三本書,寫個簡短介紹,用真人秀的風格寫,幫我起草一封郵件。"Gemini 直接從當前頁面提取資訊,在側邊欄裡把郵件寫好,連書的簡介都給你編好了(而且還是真人秀風格的,帶點戲劇性)。你全程不需要離開正在看的頁面。 大綱在主窗口,郵件在側邊欄,一心二用,效率翻倍。寫完之後,它還可以呼叫 Gmail,直接一鍵傳送。搞定。這種"讀當前頁面 + 執行另一個任務"的能力,才是 AI 真正融入工作流的樣子。Connected Apps:Google 全家桶深度打通接下來這個功能,打工人狂喜。Gemini 不只是跟 Chrome 聯動,而是跟整個 Google 生態打通了。官方叫它 Connected Apps(關聯應用)。目前支援的應用包括:Gmail(郵件)Google Calendar(日曆)YouTubeGoogle Maps(地圖)Google Shopping(購物)Google Flights(航班)這些應用可以在 Gemini 設定裡一鍵開啟。這意味著啥?舉個例子:你要出差參加一個會議,需要訂機票。以前怎麼做?翻郵件找會議時間 → 打開機票網站搜航班 → 比價 → 訂票 → 再寫郵件告訴同事你的到達時間……現在呢?你跟 Gemini 說一句:"幫我查一下下周那個會議的時間,推薦幾個航班,然後寫封郵件告訴同事我的到達時間。"Gemini 自己去翻你的郵件找會議詳情,自己去 Google Flights 查航班,自己幫你起草郵件。一句話,三件事,全搞定。個人智能 Personal Intelligence:越用越懂你這個功能目前還在預告階段,但聽起來非常值得期待:Personal Intelligence(個人智能)。允許 Chrome 記住你的偏好記住過去的對話上下文支援自訂指令提供更“像你助理”的回答簡單說,就是 Gemini 會記住你之前的對話上下文,然後基於這些記憶,給你更個性化的回答。比如你之前跟它聊過你喜歡什麼風格的酒店、你的預算範圍、你對航班時間的偏好……下次你再問它"幫我訂個酒店",它就不會從零開始問你一堆問題,而是直接根據你的偏好給推薦。從一個通用工具,變成一個懂你的私人助理。當然,Google 強調這個功能是使用者主動開啟的,你可以選擇連接那些應用,也可以隨時斷開。隱私控制權在你手裡。真正的核武:Auto Browse(自動瀏覽)上線!好,前面都是開胃菜。接下來這個功能,才是這次更新的真正炸裂之處↓Gemini 開始"接管方向盤"這是我最想吹爆的功能,沒有之一!以前 AI 只能“動嘴”,現在它能“動手”了。這就是所謂的 AI 正式接管“方向盤”。這是什麼概念?Gemini 不再只是"回答問題",而是真的能像人一樣打開網頁、點選按鈕、填寫表單、替你完成任務。場景一:訂酒店演示裡,使用者說:"我想去芝加哥,住某某酒店,幫我查一下這幾個周末的價格,還有一些其他要求。"Gemini 直接打開 Expedia,自己開新標籤頁,自己點日期選擇器,自己篩選條件,最後把搜尋結果整理好呈現給你。不是給你一個連結讓你自己去看,是它替你完成了整個搜尋流程。場景二:篩選公寓在 Redfin(美國找房網站)上,使用者說:"幫我看看我的最愛裡的公寓,把不允許養寵物的刪掉,然後把 Gabriel 加為協作者。"Gemini 打開收藏列表,點進每個房源,看細則,檢查寵物政策,不符合的自動移除,最後還幫你邀請了室友。一個小時的繁瑣操作,變成一句話。場景三:填表格使用者有一份 PDF 格式的球隊名單,要給一個線上報名系統填表。以前這是複製貼上的地獄。現在?"用名單裡的資訊,幫我報名,填上他們的名字和位置。"Gemini 從 PDF 裡提取資料,自動填進表單欄位。手工活,自動化了。想像一下這個場景:你想去大理旅遊,但你懶得翻攜程、看去那兒、查攻略。你只需要對側邊欄的 Gemini 說:“幫我查下 3 月中旬上海去大理最便宜的機票,順便搜下雙廊附近 500 元以內、評分 4.5 以上、帶露台的民宿。”接下來神奇的一幕發生了:瀏覽器會自動開啟一個新的“發游標籤頁”,你能看到它自己在搜尋框打字、自己在點滑鼠、劃螢幕、翻頁面。它不是在呼叫 API,而是在像人一樣替你上網。查完之後,它會在側邊欄給你列出一張清晰的對比表,甚至連預訂表單都能幫你填好大半,你只需要點個“支付”。這那是瀏覽器啊,這簡直是請了個全能小秘書。😂視覺購物:看圖下單,預算可控最後一個演示,是我覺得最"未來感"的一個。場景是這樣的:使用者看到一張 Y2K 風格派對佈置的照片(就是那種千禧年復古風),想復刻這個佈置。以前怎麼做?自己盯著圖,分析裡面有什麼東西——氣球、綵帶、背景布、裝飾道具……然後一個一個去電商網站搜,比價,加購物車,算總價,超預算了再刪幾個……現在呢?你跟 Gemini 說:"去 Etsy,幫我找到能復刻這個佈置的東西,加到購物車,預算不超過 75 美元。"Gemini 先用 Gemini 3 的多模態能力分析圖片內容(氣球是什麼顏色、背景簾是什麼款式、有那些道具),然後去 Etsy 搜尋對應商品,自己比價,自己控制預算,最後把商品加進購物車。更絕的是,官方還提到:Gemini 會自動幫你找優惠碼並應用上去。你打開購物車的時候,發現東西都選好了,總價正好卡在預算線上,優惠碼也用上了。從"我想要這個效果"到"購物車已就緒",一句話的事兒。這不是"幫你搜東西",這是"幫你買東西"。 購物體驗直接跳過了中間所有的繁瑣步驟。小互的思考:這背後的狠招是什麼?我覺得,這次升級其實暴露了Google 的一個陽謀:它想把瀏覽器變成 AI 時代的新型作業系統,從而截殺所有想分流的對手。為什麼這麼說?以前我們要用 AI,可能會去搜 ChatGPT,或者去用 Arc 這種號稱“AI 瀏覽器”的新玩意。Google 這一波操作,意思很明確:既然全球 60% 以上的人都在用 Chrome,那我為什麼不直接把 AI 變成空氣呢?它要讓你形成一種“肌肉記憶”——凡事不決問網址列,凡事想寫點啥點右鍵。這其實是在利用生態位進行防守反擊。還有一點是:Gemini 3 開始佈局 “Personal Intelligence(個人智能)”。只要你授權,它能讀你的 Gmail 郵件、看你的 Google 日曆、翻你的雲端硬碟。這意味著它比你更懂你自己。未來你將離不開它,遷移成本更加高!它不再是在提供搜尋結果,它是在直接提供決策結果。以前我們要搜“我的行程”,現在直接問它“我明天幾點出發去機場最合適”,它能自動結合你的機票確認郵件、即時的交通路況、甚至明天的天氣,直接給你一個最終答案。這其實是一個非常恐怖的閉環。Google正在把你所有的數字生活都圈在 Chrome 這個金魚缸裡。這曾經是 OpenAI 的主要競爭力,現在看來蕩然無存了!但這也有個潛在的代價,那就是你的瀏覽行為、你的歷史記憶、你的搜尋偏好,甚至你在網頁上輸入的每一個字,都在Google  AI 的“喂養”之下。雖然效率起飛了,但這種隱私的“裸奔感”,換個角度看,其實挺讓人唏噓的。我們是用一部分隱私和自主思考,換取了這種極致的便利。其他你可能關心的一些問題需要登錄的網站?也能搞定你可能會問:有些網站需要登錄才能操作,Gemini 怎麼辦?答案是:可以用 Google Password Manager。如果你授權了,Gemini 可以用你保存在 Google 密碼管理器裡的帳號,自動登錄網站,然後繼續執行任務。當然,這個功能需要你主動授權,不是默認開啟的。安全機制:敏感操作會暫停確認看到這裡,你可能會有點擔心:這麼強的自動化能力,萬一 AI 做錯了怎麼辦?Google 顯然也想到了這個問題。官方說,他們為 Auto Browse 設計了全新的安全防護機制,針對新型網路威脅做了專門的防禦。更重要的是,敏感操作會暫停並要求你確認。比如:下單付款前,會暫停,讓你確認在社交媒體發帖前,會暫停,讓你確認其他涉及隱私或金錢的操作,都會暫停你始終掌握最終決定權。 Gemini 是幫你幹活的,不是替你做決定的。UCP 協議:讓 AI 購物成為行業標準這個資訊可能比較技術,但值得一提。Google 還宣佈 Chrome 將支援一個叫 UCP(Universal Commerce Protocol,通用商務協議) 的開放標準。這個協議是 Google 和 Shopify、Etsy、Wayfair、Target 等行業巨頭一起制定的,目的是讓 AI 代理能夠在各種電商平台上無縫地代表使用者執行操作。什麼意思?就是說,未來不只是 Google 自己的服務,第三方電商平台也會支援這種"AI 代你下單"的模式。這是一個行業等級的變化。AI 購物不再是某一家公司的專屬功能,而是要變成整個電商生態的標準能力。什麼時候能用?在那能用?說了這麼多,什麼時候能用上?根據官方資訊:平台:MacOS、Windows、Chromebook Plus地區:目前僅限美國使用者:Auto Browse 功能需要 Google AI Pro 或 Ultra 訂閱Nano Banana:所有 Gemini in Chrome 使用者都能用對於國內使用者來說,可能需要自己想想辦法。但不管怎樣,方向已經很清楚了:AI 瀏覽器的時代,真的來了。 (小互AI)
Fortune雜誌─蘋果Google聯手:一場奇襲
上周,蘋果與Google意外宣佈達成一項人工智慧合作協議,迅速在科技行業掀起軒然大波,並推動Google市值一度突破4兆美元大關。根據協議,蘋果將把Google的AI技術整合到自家的移動作業系統中,包括用於升級Siri語音助手。Google首席執行長桑達爾·皮查伊與蘋果首席執行長蒂姆·庫克。近日,兩家公司宣佈達成一項重大合作協議,蘋果智能相關功能包括新版Siri語言助手將採用Google的Gemini大模型及相關AI技術。圖片來源:Anna Moneymaker—Getty ImagesGoogle重獲AI領先地位自2022年11月OpenAI推出ChatGPT後的近兩年間,Google在AI領域的表現曾備受質疑。在追趕OpenAI的ChatGPT和Anthropic的Claude過程中,這家搜尋巨頭似乎步履維艱。Google的聊天機器人Bard及後續Gemini模型曾在公開場合出現事實錯誤,比如推薦在比薩上塗膠水、生成“黑人納粹”這種有歷史錯誤的圖像。然而,Google最新的Gemini 3大模型已成為市面上最先進的模型之一,獲得了使用者和企業的廣泛認可。Google雲服務也吸引了大批客戶,這與它自研的TPU晶片有一定關係。在運行AI模型時,TPU相比輝達的GPU具備成本與速度上的雙重優勢。蘋果在聲明中稱,經過“審慎考量”,認定Google的AI技術為其基礎模型“提供了最強大的支援”。這對Gemini而言無疑是重要背書,而此前蘋果一直首選OpenAI作為“蘋果智能”的技術供應商。美銀分析師認為,此次合作鞏固了“Gemini作為移動裝置端領先大語言模型的地位”,並有助於增強投資者對Google搜尋業務穩定性及長期盈利能力的信心。AI智能體初創公司創始人、劍橋大學賈奇商學院戰略與政策講師哈姆扎·穆達西爾指出,蘋果的選擇可能不僅基於技術能力的考量。由於蘋果禁止合作夥伴使用其使用者資料訓練模型,穆達西推測,蘋果可能認為,Google所能夠提供資料隱私和智慧財產權方面的保障是OpenAI和Anthropic難以企及的。合作也將為Google帶來直接的營收增長。儘管相關財務細節尚未披露,但據彭博社早前報導,蘋果可能每年會向Google支付約10億美元的技術使用費。不過對Google來說,這項合作更大的意義在於擠進了蘋果的管道。蘋果在全球擁有大約 15億iPhone使用者。通過為新版Siri提供支援,蘋果使用者未來通過Siri進行網購或消費,Google都有望從中獲得一定的分成。長遠看,Gemini聊天應用未來甚至可能預裝到新款iPhone中。對蘋果而言,此次合作有利有弊蘋果首席執行長蒂姆·庫克。圖片來源:David Paul Morris/Bloomberg via Getty Images有利的一面是,蘋果能夠向使用者提供功能更強大的Siri語音助手等功能,成本較低,而且保障了使用者的隱私。韋德布什證券公司分析師丹·艾夫斯表示,該合作為蘋果“加速推進2026年及以後的AI戰略奠定了堅實的基礎”。然而,蘋果仍需依賴外部合作夥伴提供核心AI功能暴露出其短板。擅長垂直整合的蘋果,在自研大語言模型方面卻仍面臨重重困難。生成式AI時代開啟以來,這個難題始終困擾著蘋果。2025年,多項“蘋果智能”功能推遲上線,新版Siri發佈也一再延期。這些延誤不僅損害了蘋果作為科技領軍者的聲譽,也引發了使用者的不滿。甚至有使用者因為iPhone 16廣告中宣傳的AI功能未能如期上線,而對蘋果提起了集體訴訟。蘋果CEO蒂姆·庫克曾承諾2026年推出升級版Siri,外界普遍預期會搭載蘋果自研大模型。但顯然蘋果自有模型尚未準備就緒,最終轉向了Google的技術。未來科技集團的分析師丹尼爾·紐曼指出,長期以來,憑藉龐大的使用者基數和銷售網路,蘋果在追逐AI等新趨勢時可以更從容,但2026年對蘋果來說是“成敗攸關的一年”。日前,庫克已經對公司的管理層進行了人事調整,任命一位曾參與GoogleGemini項目的高管負責AI業務。如果蘋果智能的延期發佈確實與隱私與安全有關,那麼使用者的等待或許是值得的。理想情況下,蘋果希望打造一個既能媲美頂尖模型,又能完全在iPhone上本地運行,而不需要將使用者資料上傳到雲端。穆達西爾認為,蘋果可能正攻克模型功耗與散熱等技術難題。與Google合作,既可以為蘋果爭取時間,在模型壓縮與架構設計方面實現突破,又能夠在一定程度上緩解來自華爾街的壓力。部分支援蘋果的人指出,蘋果從來不是新技術的先行者,例如世界上第一款MP3播放器、智慧型手機、無線耳機、智能手錶,都不是蘋果發明的,這家科技巨頭卻總能憑藉設計創新和行銷策略而後來居上。蘋果也有從合作夥伴學習關鍵技術而後自研的傳統,如晶片。而在搜尋領域,蘋果Safari瀏覽器長期整合Google搜尋,並未自研,也沒有影響其發展。未來蘋果在AI領域是否會複製這樣的模式,尚待觀察。對OpenAI無疑構成利空OpenAI首席執行長山姆·奧爾特曼。圖片來源:Florian Gaertner/Photothek via Getty Images蘋果與Google的合作並非排他性協議,意味著蘋果可能仍然會在部分“蘋果智能”功能中採用OpenAI的模型,但蘋果選擇與Google合作,對OpenAI來說無疑是一記重擊。這強化了一種觀點:Google不僅追上了OpenAI,更在模型能力上實現反超。一旦失去蘋果生態,OpenAI將難以實現使用者群的進一步增長。目前,OpenAI聲稱它的周活躍使用者超過8億人,但近期資料顯示增長可能放緩。OpenAI首席執行長山姆·奧爾特曼曾稱,許多人已經將ChatGPT視為AI的代名詞。但是在蘋果使用者通過Siri體驗過Gemini模型的出色性能之後,這種認知可能會發生改變。奧爾特曼上月對媒體表示,他認為蘋果是OpenAI的長期主要競爭對手。OpenAI正聯合蘋果前首席設計師喬尼·艾夫研發新型AI裝置,旨在挑戰智慧型手機作為AI助手主要載體的地位,這款裝置有望在今年亮相。以前,只要蘋果還依賴ChatGPT為Siri提供技術支援,OpenAI就能清晰瞭解競爭對手的能力。但今後,OpenAI恐怕很難再深入瞭解蘋果AI的進展,從而難以將其新產品定位為“iPhone殺手”。OpenAI希望通過這款新裝置,將使用者牢牢鎖定在自己的系統中,這種做法有些類似於蘋果硬體+iOS的閉環生態,能夠有效防止使用者流向功能相近的競品。另外,OpenAI還要繼續推進技術突破,從而具備超越Google的決定性優勢,並長期保持。唯有如此,OpenAI才有可能促使蘋果未來重新加大對它的技術依賴。又或者,彎道超車的OpenAI,或許真的有可能憑藉一款跨時代的AI硬體,終結對蘋果裝置和管道的依賴。(財富中文網)編者語曾被質疑落後的Google,憑藉TPU晶片、Gemini模型和雲生態的綜合優勢,贏得了最挑剔的客戶蘋果的認可,標誌著AI競賽已從模型能力的單點比拚,升級為“晶片—模型—雲—生態”的全鏈條對抗。選擇GoogleGemini驅動Siri,而非堅守“全端自研”,證明在AI時代,頂尖的技術實力與擁有龐大使用者的硬體生態結合,才能形成更強的競爭力。對於建構生態圍牆的中國手機廠商與AI公司,開放合作也是一個打開市場空間的可選項。 (財富FORTUNE)
僅用一周時間,Google就讓OpenAI認清現實
究竟是什麼樣的更新,才能讓GoogleCEO皮查伊稱之為“眾望所歸”(Answering a top request from our users)?那就是GoogleGemini最新的Personal Intelligence功能。它通過使用者Gmail、Google Photos、YouTube和搜尋等應用的資料,讓AI能夠跨資料來源推理,提供個性化回答。真正意義上實現了AI全能管家。幾乎同時,Google還與蘋果達成多年期合作,Gemini 3將成為新版Siri的技術底座。還有通用商務協議的發佈。一系列動作密集而迅猛。資本市場的反應也是立竿見影,Alphabet市值突破4兆美元,19年來首次超越蘋果。這一系列更新背後,是Google全端優勢的體現。從硬體到軟體,得益於Google在AI產業鏈的每個環節都有佈局,而他們也正在用技術堆疊控制越來越多的生態。Google釋放的訊號很明確,不僅要贏,還要贏得更徹底。技術代差可以追趕,資金差距可以彌補,但生態位的差距一旦形成,OpenAI們可能就永遠無法追趕上Google了。01Google和蘋果的合作,是一次世紀握手。1月12日,兩家公司聯合宣佈達成多年期合作協議,Gemini 3將成為下一代蘋果智能(Apple Intelligence)的技術底座。這次合作並非單純的提供基座大模型那麼簡單。文章《“套殼”GoogleGemini,但蘋果還沒死心自研模型》中提到,Gemini作為後台訓練導師與複雜任務處理引擎(負責資訊摘要、跨應用調度等),蘋果自研模型處理本地敏感資料。所有使用者互動與資料流轉通過蘋果私有雲完成,Siri控制權與隱私標準仍由蘋果掌控,核心落地場景為今年晚些時候推出的新版個性化Siri。根據外媒報導,這筆交易預計每年為Google帶來約10億美元的收入,但更重要的價值是資料。Siri每天處理約15億次請求,這些互動資料將進一步強化Gemini的Agent能力。即便不觸碰任何使用者的敏感資料,但是Gemini依然會瞭解使用者的需求和處理結果。因此,當使用者習慣在新版Siri中完成各種任務時,Google就掌控了從使用者意圖到應用執行的完整鏈條。幾乎在同一時間,Google在美國零售聯合會推出通用商務協議(Universal Commerce Protocol,UCP)。這是一個開放原始碼的AI電商標準,可以讓AI代理與商業系統無縫對接。Google與Shopify、Walmart、Target、Wayfair、Etsy等20余家零售和支付巨頭聯手打造這一協議,使使用者可以直接在Gemini應用和AI Mode中完成商品搜尋、比價、下單和支付,無需跳轉到商家網站。這種“原生結帳”體驗徹底改寫了電商的流量邏輯,入口從獨立電商網站轉移到了AI對話介面。在零售端,Gemini還接入了Google Shopping Graph。這是一個包含超過百億商品資訊的知識庫,支援AR虛擬試穿、價格保護、即時庫存查詢等功能。說回Google的Personal Intelligence功能,它與ChatGPT僅能參考過往對話歷史不同,這個功能主打的是可以跨應用推理,分析資料點之間的關係。Google提供的案例顯示,當使用者站在輪胎店排隊卻不知道自己的2019款本田小型貨車需要什麼型號的輪胎時,Gemini可以從Google Photos中識別車輛配置,從Gmail收據中找到車牌詳細資訊,然後建議不同的選項。比如一種適合日常駕駛,另一種適合全天候條件,參考的是在Google Photos中找到的家庭前往俄克拉荷馬州的公路旅行記錄。使用者可以單獨控制每個資料來源的存取權,在隱私保護和功能體驗之間取得平衡。Google強調,Gemini不會直接在Gmail收件箱或Google Photos庫上進行訓練,而是僅使用“有限資訊,如Gemini中的特定提示和模型的響應”來改進這一能力,且會採取措施過濾或模糊對話中的個人資料。目前該功能已向AI Pro和Ultra訂閱使用者開放測試。02AI產業正在進入一個被稱之為“inference economics”(推理經濟學)的時代。在這個時代,競爭優勢不再由訓練模型的參數量定義,而是由“以最低成本提供有用資訊”的能力決定。而Google在這方面的佈局堪稱教科書等級。Google使用自研的TPU晶片訓練模型,它的優勢主要集中體現在在推理環節上。這是因為GPU每做一次運算,都要頻繁地從快取或記憶體(HBM)中讀寫資料。這種“存取-計算-存取”的循環在推理時會消耗大量頻寬和電力。TPU讓資料在處理單元之間直接傳遞。一旦權重載入進陣列,資料流進去就能連續完成成千上萬次乘加操作,無需中間寫回記憶體。不僅如此,為了兼顧圖形渲染、科學計算等任務,GPU擁有複雜的調度邏輯、分支預測和指令快取。這些在純粹的推理運算中屬於“無效載荷”,但又必須耗費計算資源。TPU剝離了所有非AI相關的電路。在推理時,由於模型結構是固定的,TPU能以極高效率的批處理(Batching),幾乎沒有時鐘周期被浪費在指令調度上。此外,Google在TPU Pod中使用了自研的OCI(光學電路交換)技術。相比於輝達依賴的電纜和 NVLink 開關,Google的光學互聯能以更低的功耗提供數 Tbps 的跨晶片頻寬。這使得 TPU 在處理超長上下文或超大模型推理時,通訊開銷更小。當Gemini每天處理數十億次查詢時,每次推理那怕只節省幾美分,累積下來就是數億美元的成本優勢。更深層的優勢體現在商業模式上。Google並不追求AI訂閱收入的最大化,Gemini Advanced的定價策略比ChatGPT Plus更便宜,甚至在某些場景下完全免費,比如edu帳號可以全年免費。Google的戰略是“羊毛出在豬身上”,強化生態鎖定、增加使用者停留時間、提升廣告定向精度。根據財報,Google約80%的收入仍然來自廣告。對於Google來說,AI 並不是一個新生意,而是一次“廣告引擎的史詩級大修”。Google將Gemini深度嵌入。用得越多,使用者的資料畫像就越清晰,廣告推送也就越精準。不僅如此,傳統的藍色連結是搜尋引擎讓你盡快離開,點選去別的網站。但是和Gemini對話截然相反,Google需要使用者繼續留在Gemini裡。使用者停留時間越長,展示高價值廣告的機會就越多。Google不靠賣AI賺錢,而是用AI讓現有的廣告生意變得更賺錢。迭代速度的優勢同樣關鍵。從DeepMind的研究idea到TPU的晶片最佳化,再到模型訓練和產品部署,Google可以在一個閉環內完成整個鏈條。而像OpenAI這樣的AI企業,想要更新就需要協調微軟的Azure雲、輝達的晶片供應、第三方的資料合作,決策鏈條冗長,響應速度必然慢半拍。在AI軍備競賽的“以周計算”節奏中,這種速度差異可能決定市場窗口的得失。所以Google才會更新得越來越快,同時他們還在擴大優勢,形成“贏家總贏”的局面。打下推理成本後,通過與蘋果的合作,Google獲得了大量的Siri請求資料,相當於ChatGPT日均25億次提示詞的60%。而通過UCP,Google還將在電商AI入口的爭奪戰中搶得先機。這不是簡單的技術合作,而是對流量分發權的重新定義。資料飛輪是Google最難以複製的護城河。Google擁有Search、YouTube、Gmail、Maps等九個使用者超過10億的產品,每天產生的資料量遠超任何競爭對手。Personal Intelligence功能的推出,讓這些資料首次被深度整合到AI體驗中。使用者每一次與Gemini的互動,都在強化模型對個體偏好的理解,形成正反饋循環。這種“資料→模型→體驗→更多資料”的飛輪效應,是OpenAI等獨立AI公司難以企及的。03視角切換到OpenAI這邊,他們此刻正陷入前所未有的困境。2025年底,就在Gemini 3發佈後不久,OpenAI CEO Sam Altman向全體員工發出了“紅色警報”(code red)。OpenAI公司暫停了所有商業化項目,包括廣告平台、個人助手Pulse、購物代理以及健康AI工具的開發。全員轉向一個目標,那就是追上Gemini 3的水平。奧特曼後來在播客中承認,這種“紅色警報”狀態通常會持續6到8周,但他補充說:“Gemini 3的影響沒有我們擔心的那麼大。”然而市場資料講述了另一個故事。根據Similarweb的分析,ChatGPT在生成式AI市場的份額從2025年1月的87.2%跌至2026年1月的64%,而Gemini在同期從5.7%漲至21%。ChatGPT的網路流量在近幾周下降了22%,從12月初的約2.03億日均訪問量降至1.58億,而Gemini的使用量保持穩定在5500萬至6000萬日均訪問量。此消彼長之間,ChatGPT的統治地位正在被撼動。根據Google財報電話會議,Gemini的月活躍使用者從2025年7月的4.5億增長到10月的6.5億,三個月內增長44%。反觀,Similarweb的資料顯示,ChatGPT同期增長僅為5%-6%。蘋果合作的“降級”更是一記重擊。OpenAI曾是蘋果在AI領域的首選合作夥伴,ChatGPT被整合到蘋果智能中,用於處理複雜查詢。但在Google與蘋果的新協議下,OpenAI的角色被邊緣化了。投資研究公司Equisights Research的CEO Parth Talsania一針見血地指出:“蘋果選擇Gemini作為Siri的底層技術,意味著OpenAI轉變為輔助角色。ChatGPT仍然可用於複雜的、使用者主動選擇的查詢,但不再是默認的智能層。”更深層的跡像在於,Google全端優勢正在放大。OpenAI沒有自己的搜尋引擎、作業系統以及產品矩陣。每一個APP之間除了帳號相通以外,都是獨立運作的。但Google可以將Gemini無縫嵌入Gmail、Docs、YouTube等使用者日常使用的工具中,反之還有Personal Intelligence功能。ChatGPT卻只能要求使用者主動離開現有工作流程,使用者想生成視訊就得從ChatGPT裡退出來打開Sora App。Google很清楚一件事:使用者對AI模型本身並不忠誠。這個行業的殘酷真相是,使用者會毫不猶豫地在ChatGPT、Gemini、Claude之間來回切換,誰的模型在某個任務上表現更好,他們就用誰。資料顯示,越來越多的開發者開始使用LangChain這樣的抽象層,讓應用可以在不同的AI提供商之間無縫切換,而不需要重寫程式碼。這種“多模型策略”正在成為常態,ChatGPT用於寫作,Claude用於任務編排,Gemini用於多模態理解。但使用者對他們的資料、使用習慣、費用預算和工作效率倒是非常忠誠。他們的資料不可能輕易遷移到其他平台,這些習慣也不可能一夜之間改變。所以Google的戰略就是抓住這些真正的忠誠度,通過更大的AI生態讓使用者感受到持續的價值增長,鎖住使用者。當使用者發現在Gmail裡就能直接用Gemini起草郵件,在Google Docs裡就能讓AI幫忙潤色文章,在YouTube裡就能獲得視訊摘要,他們為什麼還要打開一個獨立的ChatGPT標籤頁?這種“無縫體驗”遠比模型更有吸引力。別的模型可能更聰明,但Gemini就在每天使用的工具裡,不需要切換窗口,不需要複製貼上,這就夠了。關鍵的是,Google還在不斷降低使用者使用AI的門檻,用價格戰進一步擴大優勢。免費使用者現在可以在Gemini CLI中使用Gemini 3,以前只有付費使用者才能使用。1月初,新使用者年訂閱Google One的AI Pro半價促銷。這些動作的目標很明確:讓更多使用者進入Google的生態系統,讓他們習慣在Google的產品中使用AI,讓遷移的成本變得越來越高。當技術競賽演變為生態位競爭,先發優勢和資金儲備都不再是決定性因素。Google正在用全端建造一個AI帝國。而對於OpenAI和其他競爭者來說,亮出“紅色警報”並不能解決問題,他們想要追上Google的腳步,只會越來越艱難。 (字母AI)
大模型都差不多了,AI公司靠什麼賺錢?|對話 Mistral CEO
2025 年底,一個明顯的訊號出現了:Google Gemini 追平了 OpenAI,Claude 短暫超越過 GPT-4,中國模型也在快速逼近。頭部模型的差距,正在以肉眼可見的速度縮小。1 月 14 日,《Big Technology Podcast》拋出了這個問題:“如果所有頭部模型的表現都差不多,會發生什麼?”坐在對面的是法國大模型公司 Mistral AI 的聯合創始人兼 CEO Arthur Mensch。他的回答沒繞彎子。“當大家的模型都差不多了,競爭就不在模型本身了。以前比誰更聰明,現在比誰能讓客戶真的用起來。光有一個強模型不夠,得讓它進到企業的系統裡、流程裡、業務裡。”這不是技術問題,是商業問題。而且,性能拉不開差距,價格就會被壓、毛利就會被擠。你再多加多少參數,也很難說服客戶為什麼要多掏一倍的錢。那錢會流向那裡?第一節|模型差不多了,然後呢?要回答這個問題,得先搞清楚:為什麼模型會差不多?Mistral CEO Arthur Mensch 沒迴避:沒錯,差不多了。開發模型本質上不是什麼獨門生意。現在全球大概有十來個實驗室,用的是同一套方法、同樣的資料,做出來的模型效果越來越接近。更新速度快,誰都能追上,模型也就不再是護城河。為什麼會這樣?因為開源讓技術傳播得太快了。Mistral 在 2024 年初開源了稀疏混合專家架構(Sparse Mixture of Experts),幾個月後,中國團隊做出了更聰明的版本 DeepSeek-V3,用更低的成本、更高的效率達到了同樣的效果,這種工程最佳化能力相當出色。反過來,DeepSeek 的一些訓練技巧也被歐美團隊借鑑。技術公開,大家互相學習。Mensch 舉了個資料:2024年,預訓練模型要做到10的26次方 FLOPs(運算規模)還很難,現在任何有資源的團隊幾個月就能追上。門檻在下降,差距在縮小。但他更擔心的不是大家都差不多,而是模型只是看起來厲害,企業卻用不上。那投入再多也沒意義。這個判斷不只是 Mistral 一家的。幾周前,Sam Altman 在紐約告訴一群新聞負責人,OpenAI 2026年的主要優先事項之一是為企業建構應用程式。Mensch 說:“AGI 這個概念太簡單了。不存在單一系統能解決所有問題,就像沒有任何人類能解決世界上的每個任務一樣。”過去三年,大家都在談模型有多聰明,卻很少有人問企業能不能真的用起來。現在競爭焦點變了:不追求模型最強,而是確保企業真能用得上。第二節|真正賺錢的,不是模型那麼,“用得上”具體是什麼意思?很多 AI 公司只會說模型多強,卻說不清怎麼幫企業用起來。Mistral 給了明確答案。CEO Arthur Mensch 把企業 AI 應用分成兩類:一類是效率提升,讓原來 20 人幹的活,2個人就能搞定。另一類是技術突破,幫企業突破以前做不到的事。 先看效率提升。1、效率提升法國航運巨頭 CMA CGM,每次大船靠岸,要協調碼頭、監管、卡車調度、港口裝卸……流程極複雜。以前,靠20多名員工輪班調度,系統雜、溝通難。現在,Mistral 讓 AI 代替人跟 20 多個外部系統打交道,自動發消息、下指令、確認流程。人還在,但變成了把關的,原來20人的事,最後2個人就能做完。AI 做的不是回答問題,而是真的在幹活。背後的邏輯其實很簡單。Mensch 解釋說,AI 不是自己什麼都能幹,而是人定規矩、AI 執行。他把這個系統分成兩部分:人定的規矩:那些步驟必須人工確認,那些可以自動化,這些規矩是人提前定好的。AI 的發揮:具體怎麼執行,AI 可以根據實際情況自己判斷。比如這條船先卸那個集裝箱,AI 看情況決定。“以為 AI 能自己搞定一切,那是不現實的。這兩者配合起來,才是真正能用的系統。”2、技術突破再看第二類。ASML 的光刻機製造過程,涉及極高精度圖像識別。過去要靠專家看圖識錯,找出晶片有沒有問題。Mistral 的模型幫他們做的事,是把圖像和邏輯一起看,自己分析、自己標註、自己最佳化。這不只是省人力,而是突破了晶片製造的精度瓶頸。AI 能看到人眼無法識別的缺陷,能加速人工標註太慢的流程。精度提升帶來的變化是:晶圓廠的吞吐量上去了,晶片製程能往更小的奈米推進,整個半導體行業的物理極限在被 AI 推動。在他看來:“核聚變、更精細的半導體雕刻……在這些領域我們正遇到物理限制,而 AI 可以幫助解除這些限制。這才是技術進步的加速,這帶來的價值,比單純省人力大得多。”這兩個案例說明了同一件事:AI 公司真正要做的,不是賣一個聰明的模型,而是讓 AI 進到企業的日常工作裡。賣模型是賣能力,企業真正要的是能落地的方案。很多 AI 實驗室在模型上投入巨大,但最後能掙到錢的,是那些真正讓 AI 在企業裡用起來的小公司。第三節|控制權值多少錢?說到讓AI用起來,Mistral靠的是三件事:能用、能控、不受限。1、先看能用他們家模型是開放原始碼的,不只是給你一個黑盒工具,而是允許企業根據自己情況動手改、接入系統、部署在自己機器上運行。這在很多閉源大模型裡是做不到的。2、再看能控如果你的模型只能在供應商的雲上用,一旦那家公司修改了權限、更新了政策,甚至不讓你用某個功能,你就只能被動接受。Mensch 打了個比方: 就像你接入了別人的電網,隨時可能被斷電。如果 AI 真的變成生產工具,你敢把主動權全交出去?這就是閉源模型的隱藏風險:被供應商綁死。“Anthropic、OpenAI 他們也會說'我們能幫你定製',但你本質上是在信任他們的工程師會給你足夠的權限。萬一他們更新了 API、改了定價、限制了某些功能呢?你只能接受。”還有更現實問題:如果你在閉源模型上訓練了自己的系統,積累了半年的資料,突然供應商漲價或者不讓你用了,你怎麼辦?遷移成本極高,因為你已經被綁住了。開放原始碼的價值就在這裡:客戶可以隨時切換、隨時自己部署,不用擔心被卡脖子。 所以,Mistral 的客戶更願意選擇它,不是因為它的模型一定比別人強,而是因為它在我手上,隨時可用。3、不受限Mistral 的優勢是:模型可以在本地運行,斷網照樣用。客戶可以根據自己的需求加功能、減參數,不需要再跟技術供應商反覆談判。這套模式,已經在一些對穩定性要求極高的場景裡驗證了。2026 年 1 月,法國與 Mistral 簽訂框架協議,要求 AI 系統必須在本土基礎設施上運行。原因很簡單:關鍵業務不能依賴外部供應商,一旦出問題,影響的是整個營運體系。對企業來說,這不只是技術問題,也是成本問題。把錢花在 Mistral 上,這筆投資會留在本地:招本地工程師、建本地資料中心、培養本地技術生態。企業未來需要技術支援、系統升級、人才儲備,都能在本地解決。反過來,如果選擇閉源服務商,錢流出去了,技術能力留不下來。長期來看,企業的話語權會越來越少。Mistral 能拿到這些訂單,靠的不是模型性能最強,而是讓企業能掌握自己的系統回到最初的問題:當大模型都差不多了,AI 公司靠什麼賺錢?答案已經很清楚了。模型會商品化,技術門檻在消失。真正值錢的,是讓AI在企業裡落地,以及把控制權交給企業。AI 越重要,控制權就越值錢。 (AI 深度研究員)
Google的Gemini開掛了,重磅利多多到數不過來
不到一周的時間,我數了數GoogleGemini的重磅利多,至少5個。不是AI應用的dau、tokens的線性利多,而是GoogleAI生態版圖的巨大擴張。Apple的AI選定了Gemini1月12日,Apple和Google發了個聯合聲明,Apple以後的"AI大腦"要用Gemini了。果粉之前的預期可是ChatGPT,結果呢?一年多過去,Apple官宣把核心AI基座換成了Google的Gemini。這個轉變的意義太大了。Apple全球有23.5億活躍裝置——iPhone、iPad、Mac等全家桶把OpenAI被踢出了核心圈。為什麼?Gemini是"原生多模態"架構,天生就能同時理解文字、圖片、聲音、視訊。Gemini 3 Pro/Flash更是靈活快捷適配各種差異化場景。Apple正在開發的那個"螢幕感知"功能——就是讓Siri能"看懂"你手機螢幕上顯示的內容然後幫你操作,用Gemini就順手得多。OpenAI的"泡沫論"和模型能力越來越難打動蘋果。Walmart和Shopify:Gemini的AI電商加速對Google來說,可能Walmart和Shopify的電商合作更有想像空間。1月11日,在紐約的零售業大會上,Walmart和Shopify幾乎同時宣佈跟Google深度合作。表面上看是"在Gemini裡能買東西了",但實際上Google在幹一件意義更大的事:制定代理商務(Agentic Commerce)的行業標準。什麼是代理商務?簡單說就是:以後你不用再打開淘寶、京東、亞馬遜這些App了,直接跟AI說"幫我買個XX",AI就替你下單、付款、安排配送。你只需要等著收貨。Google搞了個叫UCP的協議(Universal Commerce Protocol),讓所有商家都能用統一的格式接入AI。Walmart、Target、Best Buy、Home Depot這些零售巨頭都加入了,連Visa、Mastercard、American Express這些支付公司也進來了。這意味著什麼?意味著以後Gemini可能成為電商的大流量入口。你跟Gemini說"春季露營需要什麼裝備",它不光告訴你需要帳篷、睡袋、戶外爐具,還能直接推薦Walmart的具體商品,你點一下就下單了,全程不用離開聊天介面。Walmart甚至承諾30分鐘內送達。這不就是亞馬遜最怕的事情嗎?以前大家買東西第一反應是打開亞馬遜搜尋,以後可能變成直接問Gemini,亞馬遜就被架空了。Shopify那邊更有意思。它有560萬商家,大部分是中小賣家。這些人以前想觸達消費者,要麼花錢打廣告,要麼入駐亞馬遜被抽成。現在通過Gemini,他們的商品能直接出現在AI對話裡。使用者可能在聊滑雪的時候,就順手買了某個小眾品牌的滑雪鏡,根本不知道這品牌的獨立站長什麼樣。Shopify自己披露的資料也很誇張:過去一年,AI驅動的購買增長了11倍,這AI電商的爆發力太猛了。打通自家Gmail的30億使用者1月8日,Gmail正式全面上線Gemini功能,郵件摘要、一鍵生成回覆、AI收件箱檢視。看似不是什麼高科技,但架不住使用者基數太可觀了。而且,美國Fortune媒體還披露了一個重要的資料:70%的企業使用者採納了Gemini的寫作建議,轉化率遠超行業預期。商業化路徑也很清晰:基礎AI功能免費提供,但高級功能如信箱提問、專業校對需訂閱Pro版本$19.99/月,或者AI Ultra版本$249.99/月。30億使用者裡那怕只有1%付費,那也是3000萬訂閱使用者,光Gmail一項每年就能帶來幾十億美元的增量收入。Google披露他們總訂閱使用者已經超過1.5億了(含Google One和YouTube Premium),過去15個月增長了50%,而且還在加速。端側巨頭三星:加大合作至8億裝置除了前面那四個合作,還有一個差點被我忽略的,是另外一家全球端側巨頭三星的合作。今年CES上,韓國三星聯合CEO TM Roh宣佈要把Galaxy AI裝置數量從去年的4億台,翻倍到8億台,包括手機、平板、手錶、智能家電。Galaxy AI的品牌認知度在一年內從30%飆升到80%。通過三星的分發管道,Google Gemini獲得了一個無需app下載的大規模硬體分發優勢。你想想這個畫面:全球最大的Android手機廠商,加上全球最大的iOS裝置(Apple),加上全球最大的智能音箱和電視生態(Google自己的),全都跑Gemini。這樣的端側分發優勢,OpenAI和微軟短期內根本沒法趕上。最後聊聊估值Alphabet在2025年全年股價漲了65%,是"Big Five"裡表現最好的。市值首次突破了4兆美元,坐穩了全球第二大的公司。華爾街給的評級幾乎全部唱多,目標價普遍在315-390美元之間。Cantor Fitzgerald:將Google評級上調至“超配”,目標價370美元,稱其為“所有AI交易的王者”(King of all AI trades)。理由是Google是唯一一家同時擁有晶片、模型、雲基礎設施和數十億使用者級應用(App)的全端巨頭。Wedbush:認為蘋果的交易是“巨大的勝利”(Monster Win),消除了籠罩在Google頭上的長期陰雲。Morgan Stanley:隨著AI應用變得越來越複雜,企業將傾向於使用Google這樣的一體化平台,從而推高Google Cloud的估值。投行們的邏輯很直接:Gemini月活6.5億,增速30%,比ChatGPT的6%快多了;雲業務同比增長34%,合同積壓1550億美元;再加上這一波戰略合作的協同效應還沒完全釋放。AI一天,人間一年。一年前,大家還在討論ChatGPT會不會顛覆Google搜尋。現在劇情反轉了。Google不但守住了搜尋,還通過Gemini殺進了Apple、三星的生態、Walmart的貨架、Shopify的中小企業店舖、Gmail的信箱。而且這還只是Gemini的生態起點。2026年會是"AI落地驗證年"。到底誰的技術更強、誰的生態更穩、誰的商業化更順,很快就能見分曉了。 (FinHub)